import pandas as pd

# 读取 CSV 文件
data = pd.read_csv("24年底存量光伏电站.csv")

# 给数据列命名（如果文件没有列名）
data.columns = [
    '序号', '电站编号', '电站名称', '电站类型', '电站容量(千瓦)', '省', '市', '县', '县类型', '村',
    '是否贫困村', '行政编码', '发电户号', '总投资(万元)', '政府出资(万元)', '银行贷款(万元)',
    '企业资金(万元)', '捐赠资金(万元)', '自筹资金(万元)', '户数', '户主证件号码', '开工时间',
    '并网时间', '总发电量(万千瓦时)', '结算电费(万元)', '领取补贴(万元)', '是否纳入国家计划',
    '文件依据', '备注'
]

# 删除除"序号"列外其他列相同的重复数据
data_deduplicated = data.drop_duplicates(subset=data.columns[1:], keep='first')

# 保存处理后的数据到新的 CSV 文件
data_deduplicated.to_csv("processed_data.csv", index=False)

print("数据已处理完毕，合并结果保存为 processed_data.csv")
